@大麻哈
2年前 提问
1个回答

构建DataOps数据运维框架需要哪些技术

GQQQy
2年前

构建DataOps数据运维框架需要以下技术:

  • 云架构:必须使用基于云的基础架构来支持资源管理、可扩展性和运营效率。

  • 容器:容器在DevOps的实现中至关重要,在资源隔离和提供一致开发、测试、运维环境中的作用也至关重要。

  • 实时和流处理:目前来看,实时和流处理在数据驱动平台中变得越来越重要,它们应该是现代数据平台中的“一等公民”。

  • 多分析引擎:MapReduce是传统的分布式处理框架,但Spark和TensorFlow等框架日常使用越来越广泛,应该进行集成。

  • 集成的应用程序和数据管理:应用程序和数据管理(包括生命周期管理、调度、监控、日志记录支持)对于生产数据平台至关重要。DevOps的常规实践可应用于应用程序管理,但是数据管理及应用程序与数据之间的交互需要很多额外的工作。

  • 多租户和安全性:数据安全性可以说是数据项目中最重要的问题,如果数据无法得到保护,数据使用也就无从谈起。该平台应为每个人提供一个安全的环境,使每个人都可以使用这些数据并对每个操作进行授权、验证和审核。

  • DevOps工具:该平台应为数据科学家提供有效的工具,以分析数据并生成分析程序,为数据工程师提供大数据流水线的工具,并为其他人提供消费数据和结果的方法。